<html lang="pt-BR"><head><meta content="text/html; charset=utf-8" http-equiv="Content-Type"> <link rel="stylesheet" href="http://www.google.com/google.css"> <link rel="stylesheet" href="../leftnav.css"> <style>
<!--
body,td,font,p,a{font-family:arial,sans-serif}
.i { margin-left: 1em; margin-right: 2em; }
//.style1 {font-weight: bold}
.style1 {font-weight: bold}
.d {color:#999999;text-decoration:italics;font-size:10px;}
.changes {color: #FF0000}
-->
</style> <script src=" https://ssl.google-analytics.com/urchin.js " type="text/javascript">
</script> <script type="text/javascript">
  _uacct="UA-18009-2";
  _utcp="/webmasters/sitemaps/";
  _uanchor=1; 
  urchinTracker();
</script>  <title>Ferramentas do Google para webmasters</title> </head> <body class="search" bgcolor="#ffffff" text="#000000" link="#0000CC" vlink="#800080" alink="#ff0000" topmargin="3"> <table width="95%" border="0" cellpadding="0" cellspacing="2">  <tr valign="top">  <td width="1%"><a href="https://www.google.com/webmasters/sitemaps/"> <img src="http://www.google.com/images/google_sm.gif" hspace="15" height="59" width="143" vspace="5" alt="Retornar à página inicial do Google." border="0"></a></td>  <td width="100%" valign="middle">  <table width="100%" border="0" cellspacing="0" cellpadding="0">  <tr>  <td><font size="+0"><b>Ferramentas para webmasters</b></font></td>  </tr>  <tr>  <td style="border-bottom:1px solid #999999" height="1"><img width="1" height="1" alt=""></td>  </tr>  </table>  </td>  </tr> </table> <table border="0" cellpadding="2" cellspacing="0" width="95%">  <tr>  <td width="175" valign="top">  <font size="-1">  <p class="sidenavlink"><a href="about.html">Sobre as ferramentas para webmasters</a></p>  <p class="sidenavlink"><a href="protocol.html">Como usar o Protocolo do Sitemap</a></span><p class="sidenavtoc">Como usar o Sitemap Generator</p> <p class="sidenavlink"><a href="http://www.google.com/webmasters/">Central do webmaster do Google</a></p>  </font></td>  <td background="http://www.google.com/images/dot2.gif" valign="bottom" width="5"><img src="http://www.google.com/images/dot2.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="10" height="1"></td>  <td>  <div class="content">   <p><strong>Conteúdos</strong></p>  <p><font size="-1"><a href="#before"> Antes de começar</a><br><a href="#download">Download do software Sitemap Generator</a><br><a href="#config">Como criar um arquivo de configuração</a><br><a href="#copy">Como fazer o upload de arquivos para o servidor</a><br><a href="#execute">Executando o script do Sitemap Generator</a><br><a href="#submitting">Como enviar seu Sitemap para o Google</a><br><a href="#troubleshoot"> Solução de problemas</a>  </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="before"></a><b> Antes de começar</b></td>  </tr>  </tbody></table>  <p><font size="-1"> O Google Sitemap Generator é um script Python que cria um Sitemap para seu site utilizando o Protocolo do Sitemap. Esse script pode criar Sitemaps a partir de listas de URL, de diretórios de servidores web ou de registros de acesso. Para usar esse script: </font></p>   <ul>  <li><font size="-1">É preciso que você estabeleça conexão e execute scripts em seu servidor. </font></li>  <li><font size="-1">O servidor deve ter o Python 2.2 ou superior instalado. </font></li>  <li><font size="-1">Você deverá saber qual o comando que inicia o Python. (Geralmente, usa-se <strong>python</strong>, mas ele pode variar de instalação para instalação. Por exemplo, se o servidor tiver duas versões do Python já instaladas, a versão mais recente poderá ser chamada pelo comando <strong>python</strong> e a mais antiga pelo comando <strong>python2</strong>.) </font></li>  <li><font size="-1">É preciso que você saiba o caminho do diretório do site. Se seu servidor hospeda um site, esse caminho pode ser algo como <strong>var/www/html</strong>. Se você tiver um servidor virtual que hospeda vários sites, esse caminho pode ser algo como <strong>home/virtual/site1/fst/var/www/html</strong>. </font></li>  <li><font size="-1"> Faça upload dos arquivos para seu servidor (usando, por exemplo, um protocolo de FTP). </font></li>  <li><font size="-1">Se você estiver gerando uma lista de URLs com base nos registros de acesso, deverá ter conhecimento da codificação usada para esses registros, bem como seus caminhos completos. </font></li>  </ul>   <p><font size="-1">Em caso de dúvidas, verifique com sua empresa de hospedagem. </font></p>  <font size="-1">  <p>Agora você está preparado para começar. Aqui está uma visão geral sobre o que você precisa.</p>  </font>  <font size="-1">  <ol>  <li><font size="-1"><a href="#download">Faça o download</a> Sitemap Generator. Faça a extração dos campos para um diretório local. </font></li>  <li><font size="-1"><a href="#config">Crie um arquivo de configuração</a> para o site usando o arquivo <strong>example_config.xml</strong> fornecido como modelo. Modifique esse arquivo de acordo com a necessidade do site e salve-o. </font></li>  <li><font size="-1"><a href="#copy">Faça o upload dos arquivos necessários</a> para seu servidor. </font></li>  <li><font size="-1"><a href="#execute">Execute o</a> <strong>sitemap_gen.py</strong>. </font></li>  <li><font size="-1"><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">Adicione</a> o Sitemap gerado à sua conta de ferramentas do Google para webmasters. </font></li>  <li><font size="-1"><a href="#recur">Configure um script recorrente</a> (opcional). </font></li>  </ol>  </font>   <p><font size="-1">Se não conseguir usar o Sitemap Generator, adicione um Sitemap à sua conta de ferramentas do Google para webmasters em <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34606&topic=8516">outro formato</a>, como, por exemplo, um arquivo de texto simples. Você também pode encontrar links a programas de outros fornecedores compatíveis com o Google Sitemaps <a href="http://code.google.com/sm_thirdparty.html">aqui</a>.</font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="download"></a><b>1. Como fazer o download dos arquivos de programa do Sitemap Generator</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Os arquivos do Sitemap Generator estão disponíveis nos arquivos de formato ZIP e GZ <font size="-1"> em:</font></p>  </font>  <p><font size="-1"><a href="http://www.sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422">http://sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422</a></font></p>  <font size="-1">  <p>Assim que você fizer o download do arquivo, faça a extração em um diretório local. Localize os seguintes arquivos:</p>  <ul>  <li>O arquivo <strong> README</strong> &#8212;contém as informações mais recentes sobre essa ferramenta.</li>  <li><strong> sitemap_gen.py</strong> &#8212; é o script python que gera seu Sitemap.</li>  <li><strong> example_config.xml</strong> — é o arquivo de configuração modelo que será utilizado para especificar a configuração de seu site.</li>  <li><strong> example_urllist.txt</strong> —lista os modelos de URL que podem ser usados se você quiser criar um Sitemap com base no conjunto de URLs especificado.</li>  </ul>  </font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="config"></a><b>2a. Como criar um arquivo de configuração</b></td>  </tr>  </tbody></table>  <font size="-1">  </font><p><font size="-1">Esta seção fornece instruções passo a passo sobre a criação de um arquivo de configuração. Ela também fornece uma <a href="#config_reference">referência completa</a> das opções disponíveis. Se você estiver criando <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34627&topic=8493">Sitemaps móveis</a>, consulte as <a href="#creating_mobile">instruções móveis adicionais</a>. </font></p>  <font size="-1"><p>Para criar um arquivo de configuração para seu site, você deve considerar as seguintes informações:</p>  <ul>  <li>O URL base do site (como <strong>http://www.example.com</strong>/). Certifique-se de que tenha incluído o protocolo (como <strong>http://</strong>). Por exemplo, <strong>http://www.google.com</strong> é um URL base válido, mas <strong>www.google.com</strong> não é.</li>   
<li>O caminho do servidor para o local onde você deseja armazenar o Sitemap. Geralmente, esse é o caminho para o URL base, pois o Sitemap não pode conter os URLs que estão no diretório de maior nível do local do Sitemap. Ao executar o Google Sitemap Generator, ele cria o Sitemap e o coloca onde você especificar.</li>   <li>Os métodos utilizados pelo Sitemap Generator para criar o Sitemap. Use qualquer combinação de métodos. Os seguintes métodos estão disponíveis:</li>  </ul>   </font><ol> <ul>  <li><font size="-1"><strong> <a href="#URL">URL</a></strong> &#8212;lista URLs individuais nessa seção do arquivo de configuração com informações sobre cada URL. Normalmente você usaria esse método em conjunto com um outro método para incluir manualmente URLs adicionais que outros métodos não os selecionariam. </font></li>  <li><font size="-1"><strong><a href="#urllist">A lista de URLs</a> </strong> &#8212; aponta o arquivo de configuração para um arquivo de texto que contém uma lista de URLs. Esse método poderá ser usado se o arquivo de texto já existir ou se você usar um script para gerar uma lista de URLs. </font></li>  <li><font size="-1"><strong><a href="#directory">Os caminhos de diretório</a></strong> &#8212;especificam os caminhos para o site e os URLs correspondentes a esses caminhos. O Sitemap Generator criará uma lista de URLs com base no conteúdo desses diretórios. Você pode usar esse método se o site for composto por arquivos HTML estáticos. </font></li>  <li><font size="-1"><strong> <a href="#logs">Os registros de acesso</a></strong> &#8212;apontam para o caminho de seus arquivos de registro. O Sitemap Generator criará uma lista de URLs com base nos URLs desses registros. Você pode usar esse método se o site for composto por páginas dinâmicas. </font></li>  <li><font size="-1"><strong> <a href="#sitemap">Sitemap</a></strong> &#8212;indica Sitemaps existentes que você criou com o Sitemap Generator. O Sitemap Generator criará um único Sitemap que inclui os URLs contidos em cada Sitemap. Você pode usar esse método se já tiver criado vários Sitemaps menores e queira combiná-los em um Sitemap maior. </font></li>  </ul>  </ol>   <font size="-1"><p><b><a name="create_config"></a>Crie o arquivo de configuração da seguinte forma:</b></p>  </font>  <ol>  <font size="-1"> <li>Abra o arquivo <strong>example_config.xml</strong> em um editor de texto. Salve-o como um arquivo novo (como <strong>config.xml</strong> ou <strong>mysite_config.xml</strong>).</li>  </font>    <font size="-1">  <li>Localize a seção de definição do site:</li>  </font>   <pre>&lt;site 
base_url="http://www.example.com/" 
store_into="/var/www/docroot/sitemap.xml.gz"
verbose="1"&gt;</pre>   <font size="-1"><li>Altere o valor <strong>base_url</strong> para o URL do site.</li>   <li>Altere o valor de <strong>store_into</strong> para o caminho no servidor em que deseja armazenar o Sitemap e o nome de arquivo de deseja utilizar para o Sitemap. Geralmente, esse é o caminho para o URL base, pois o Google só poderá aceitar os URLs que estiverem no diretório de mesmo nível ou nos subdiretórios do diretório em que o Sitemap estiver. Você pode especificar um caminho relacionado ao diretório onde você fez o upload do script ou o caminho completo da raiz do servidor. Se fizer o upload do script para seu diretório de URL base, poderá simplesmente especificar o nome do arquivo.</li>  </font>  <font size="-1"></font><font size="-1"><li>Localize as seções do método de geração que começam com <span class="style1">** MODIFY</span> <span class="style1">or DELETE **</span>. Cada uma dessas seções corresponde a um método de geração de Sitemap.</li>  <li>Exclua as seções dos métodos que não deseja usar:</li>  <li>Siga estas instruções dos métodos que deseja usar:</li>  <p><strong> URL<a name="URL"></a></strong></p>  <p>Localize a seguinte seção:</p>  </font>  <pre>&lt;!-- ** MODIFY or DELETE ** 
"url" nodes specify individual URLs to include in the map. &lt;br&gt;

Required attributes: 
href - the URL

Optional attributes: 
lastmod - timestamp of last modification (ISO8601 format) 
changefreq - how often content at this URL is usually updated
priority - value 0.0 to 1.0 of relative importance in your site 
--&gt; 

&lt;url href="http://www.example.com/stats?q=name" /&gt; 
&lt;url 
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre>  <font size="-1">  <p>Esta seção fornece dois exemplos: o primeiro inclui somente o atributo obrigatório e o segundo inclui ambos os atributos, obrigatório e opcional.</p>  <p>Use esse formato para cada um dos URLs que deseja incluir. Os atributos <strong>changefreq</strong> fornecem ao Google uma idéia geral sobre a freqüência com que o URL é atualizado.  Isso ajuda o Google a definir a freqüência necessária para a revisitação da página a fim de obter o novo conteúdo. O atributo <strong>priority</strong> fornece ao Google informações sobre a importância relativa da comparação de uma página com outras páginas do site. Esse atributo não afeta a maneira como o Google compara sua página às páginas de outros sites, ele apenas ajuda o Google a saber quais são as páginas que você considera como as mais importantes em seu site.</p>  </font>  <p><font size="-1"><strong> Lista de URLs <a name="urllist"></a> </strong></font></p>  <font size="-1"><p>Localize a seguinte seção:</p>   </font>  <pre>&lt;!-- ** MODIFY or DELETE **
"urllist" nodes name text files with lists of URLs. 
An example file "example_urllist.txt" is provided. 

Required attributes: 
path - path to the file 

Optional attributes: 
encoding - encoding of the file if not US-ASCII 
--&gt; 
&lt;urllist path="example_urllist.txt" encoding="UTF-8" /&gt;</pre>   <p><font size="-1"> Use esse formato para apontar o caminho e o nome do arquivo de texto que contém a lista de URLs. Você pode utilizar o arquivo <strong>example_urllist.txt </strong>como um modelo para esse arquivo de texto. Você pode especificar um caminho relativo ou completo para seu servidor. Por exemplo, se o Sitemap Generator e o arquivo <strong>urlist.txt </strong>estiverem no mesmo diretório, você pode apenas especificar o nome de arquivo do arquivo<strong> .txt</strong>. Se você criar um arquivo de texto com uma codificação diferente de UTF-8, você pode utilizar o atributo <strong>encoding</strong> para indicar essa codificação. Se tiver vários arquivos .txt, use os curingas. Por exemplo:</font></p>  <pre>&lt;urllist path=&quot;example_urllist*.txt&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Para cada URL incluído no arquivo de texto, você pode especificar a data da última modificação, alterar a freqüência e a prioridade. Consulte a <a href="#urllist_reference">seção de referência do arquivo de texto da lista de URLs</a> para obter informações completas sobre a estrutura desse arquivo.</font></p>  <p><font size="-1"><strong> Caminhos de diretório<a name="directory"></a> </strong></font></p>  <p><font size="-1"> Localize a seguinte seção: </font></p>   <pre>&lt;!-- ** MODIFY or DELETE ** 
"directory" nodes tell the script to walk the file system and 
include all files and directories in the Sitemap.

Required attributes:
path - path to begin walking from 
url - URL equivalent of that path 

Optional attributes:
default_file - name of the index or default file for directory URLs

--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>   <p><font size="-1">Esta seção fornece dois exemplos. Se todas as suas páginas estiverem em subdiretórios com apenas um caminho, inclua somente uma entrada. Mas se houver vários caminhos para as páginas do seu site, inclua uma entrada para cada página. </font></p>   <p><font size="-1">Lembre-se que cada URL deve começar com o URL base que você especificou na etapa 3. Por exemplo, os exemplos fornecidos no arquivo <strong>example_config.xml</strong> têm URLs que começam com <strong>http://www.example.com/</strong>. Ambos os URLs são válidos. </font></p>   <p><font size="-1">Substitua as entradas de exemplo pelas entradas do site. Muitos sites terão apenas uma entrada que aponta para o URL base. Verifique se o valor <strong>path</strong> é o caminho completo para o diretório no servidor. Verifique se o valor <strong>url</strong> é um URL completo, com protocolo (como http) e barra final, se necessária.</font></p>  <p><font size="-1">Você pode usar o parâmetro <strong>default_file</strong> para especificar o nome do arquivo que seu servidor usa como a página padrão do diretório. No exemplo acima, <strong>/var/www/docroot</strong> resulta em <strong>http://www.example.com/index.html</strong>. Você não é obrigado fazer essa especificação. No entanto, se a fizer, o Sitemap Generator incluirá a página mapeada para cada subdiretório somente uma vez (em vez das listas de URLs de diretório e de nome de arquivo) e usará a data da última modificação do arquivo (em vez do diretório) para extrair o atributo lastmod da página. </font></p>  <p><font size="-1"><strong> Registros de acesso <a name="logs"></a></strong></font></p>  <p><font size="-1"> Localize a seguinte seção: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **
&quot;accesslog&quot; nodes tell the script to scan webserver log files to
extract URLs on your site.  Both Common Logfile Format (Apache's default 
logfile) and Extended Logfile Format (IIS's default logfile) can be read.
				
Required attributes:
 path - path to the file
Optional attributes:
 encoding - encoding of the file if not US-ASCII
  --&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.0&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.1.gz&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>   <p><font size="-1">Esta seção fornece três exemplos. Substitua essas entradas e inclua uma entrada para cada arquivo de registro. Verifique se o valor do path é o caminho completo e verifique o nome do arquivo no servidor. Se os arquivos de registro não estiverem codificados com os padrões US-ASCII ou UTF-8, use o atributo opcional <strong>encoding</strong> para <a href="#encoding">especificar</a> a codificação. Em vez de relacionar cada arquivo de registro, use os curingas. Por exemplo, no exemplo acima, você poderia incluir a entrada a seguir que incluiria os três arquivos de registro:</font></p> <pre>&lt;accesslog path=&quot;/etc/httpd/logs/access.log*&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">O Sitemap Generator atribui prioridade aos URLs encontrados nos registros com base na freqüência em que cada URL é acessado. Por exemplo, um URL que foi acessado 100 vezes, terá prioridade mais alta que um outro URL que foi acessado 2 vezes. A atribuição real de prioridade é relativa e depende da forma como cada URL é comparado aos outros URLs no site.</font></p> <p><font size="-1"><strong> sitemap <a name="sitemap"></a></strong></font></p> <p><font size="-1"> Localize a seguinte seção: </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **<br>&quot;sitemap&quot; nodes tell the script to scan other Sitemap files. This can
be useful to aggregate the results of multiple runs of this script into
a single Sitemap.

Required attributes:
path - path to the file
--&gt;
&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>   <p><font size="-1">Esta seção fornece um exemplo. Substitua essa entrada e inclua uma entrada para cada Sitemap que deseje incluir. Verifique se o valor do caminho é o caminho completo e verifique o nome do arquivo no servidor. Você também pode listar Sitemaps compactados com o gzip, desde que tenham extensão .gz. Em vez de relacionar cada Sitemap, use os curingas. Por exemplo, a entrada seguinte incluiria qualquer Sitemap que comece com a palavra &quot;sitemap&quot; e tenha extensão .xml:</font></p> <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap*.xml&quot; /&gt;</pre>  <p><font size="-1">O Sitemap Generator extrai todos os URLs e os dados opcionais listados para cada URL e para cada Sitemap que você listou e cria um Sitemap com essas informações. No momento, não podemos garantir que esse método funcione em Sitemaps criados com outras ferramentas que não sejam o Sitemap Generator.</font></p>     <font size="-1"><li>Localize a seção de definição do filtro:</li></font>   <pre>&lt;!-- ********************************************************         
FILTERS
				
Filters specify wild-card patterns that the script compares
against all URLs it finds. Filters can be used to exclude
certain URLs from your Sitemap, for instance if you have
hidden content that you hope the search engines don't find.

Filters can be either type=&quot;wildcard&quot;, which means standard
path wildcards (* and ?) are used to compare against URLs,
 or type=&quot;regexp&quot;, which means regular expressions are used
to compare.

Filters are applied in the order specified in this file.
An action=&quot;drop&quot; filter causes exclusion of matching URLs.
An action=&quot;pass&quot; filter causes inclusion of matching URLs,
shortcutting any other later filters that might also match.
If no filter at all matches a URL, the URL will be included.
Together you can build up fairly complex rules.

The default action is &quot;drop&quot;.
The default type is &quot;wildcard&quot;.

You can MODIFY or DELETE these entries as appropriate for
your site. However, unlike above, the example entries in
this section are not contrived and may be useful to you as
they are.
********************************************************* --&gt;

&lt;!-- Exclude URLs that end with a '~' (IE: emacs backup files) --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*~&quot; /&gt;

&lt;!-- Exclude URLs within UNIX-style hidden files or directories --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;regexp&quot; pattern=&quot;/\.[^/]*&quot; /&gt;</pre>  <p><font size="-1">Você pode usar um filtro para excluir URLs específicos do Sitemap gerado. Talvez você queira fazer uso desse processo para criar uma lista mais limpa, reduzindo as redundâncias, ou manter determinados URLs que estão sendo indexados. Tenha em mente que se você usar o arquivo <a href="http://www.robotstxt.org/wc/robots.html">robots.txt</a> para manter os URLs que estão sendo indexados, mesmo que os URLs estejam no Sitemap, o Google não pesquisará por eles nem os indexará. </font></p>   <p><font size="-1"> Você pode usar qualquer um ou todos os métodos de filtragem. Também pode excluir as entradas desnecessárias e pode criar entradas adicionais, se desejar. A seguir estão os modelos de utilização. </font></p>  <pre>&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*.jpg&quot; /&gt;</pre>  <p><font size="-1">Esse filtro exclui os URLs que terminam em .jpg. Talvez você queira incluir um filtro semelhante se todas as imagens forem incorporadas às páginas em HTML e não puderem ser acessadas como URLs autônomos. </font></p>  <pre>&lt;filter action=&quot;pass&quot; type=&quot;wildcard&quot; pattern=&quot;*.htm*&quot; /&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*&quot; /&gt;</pre><font size="-1"> Esse filtro inclui todos os arquivos .htm*, mas exclui quaisquer outros.</font><br>  <br>    <font size="-1"></font><font size="-1"><li>Ao concluir todas as alterações, salve o arquivo.</li></font>  </ol>    <font size="-1"><a name="config_reference"></a><p><b>Referência da sintaxe do arquivo de configuração</b></p>  </font><font size="-1">  </font>  <p><font size="-1">Observe a seguir a explicação completa sobre a sintaxe do arquivo de configuração. Toda tag começa com um exemplo de código seguido por uma descrição dos atributos. </font></p>   <p><font size="-1"><strong><a name="sitetag"></a>site<br></strong></font><font size="-1">Tag obrigatória no começo de cada arquivo de configuração. </font></p>  <pre>&lt;site
base_url="http://www.example.com/"
store_into="/var/www/html/sitemap.xml.gz"
verbose="1"
supress_search_engine_notify="1"
default_encoding="UTF-8"&gt;</pre>  <br>  <font size="-1">  <table border="1" cellpadding="2" cellspacing="0" width="100%">   <tbody><tr>  <td valign="top" width="19%"><pre>base_url</pre></td>  <td valign="top" width="6%"><font size="-1">obrigatório</font></td>  <td valign="top" width="75%"><font size="-1"> O caminho HTTP da base do site da web - somente os URLs que começam com essa base podem ser incluídos no Sitemap</font></td>  </tr>   <tr>  <td valign="top"><pre>store_into</pre></td>  <td valign="top"><font size="-1">obrigatório</font></td>  <td valign="top"><font size="-1">O caminho do servidor para o arquivo de saída desejado. O script criará esse arquivo. Não há necessidade de criar o arquivo antes de executar o script.</font></td>  </tr>   <tr>  <td valign="top"><pre>verbose</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Insira um número de 0 a 3, sendo que o número mais alto deve corresponder ao aumento de depuração</font></td>  </tr>   <tr>  <td valign="top"><pre>suppress_search_engine_notify</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1"> </font><font size="-1">Desative a notificação do mecanismo de pesquisa inserindo "1" para fins de teste</font></td>  </tr>   <tr>  <td valign="top"><pre>default_encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifique uma codificação de caracteres a ser aplicada aos caminhos de sistema do arquivo e aos URLs</font></td>  </tr>   </tbody></table>  </font>  <font size="-1">   <p></p>  </font>  <p><font size="-1"><strong>url<br></strong></font><font size="-1">Tag opcional que pode ser usada para listar cada URL no site. </font></p>  <p><pre>&lt;url
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre></p><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>href</pre></td>  <td width="6%" valign="top"><font size="-1">obrigatório</font></td>  <td valign="top" width="75%"><font size="-1"> O caminho HTTP da base do site da web - somente os URLs que começam com essa base podem ser incluídos no Sitemap</font></td>  </tr><tr>  <td valign="top"><pre>lastmod</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">A hora em que o URL foi modificado pela última vez está no formato de <a href="http://www.w3.org/TR/NOTE-datetime">data e hora do W3C</a> (AAAA-MM-DDThh:mm:ss+00:00).  Você pode omitir o horário. Exemplos:<br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">A freqüência com que o URL é alterado. Isso é considerado uma dica e não um comando.  O valor deve ser um dos seguintes: "always", "hourly", "daily", "weekly", "monthly", "yearly" ou "never".</font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">A prioridade dessa página com relação a outras páginas em seu site. O valor é um número entre 0.0 e 1.0 em que 0.0 é a prioridade mais baixa e 1.0, a mais alta. A prioridade pode afetar a ordem em que os mecanismos de pesquisa selecionam os URLs que serão explorados no site. Como a prioridade é relativa, ela só é usada entre as opções de URLs do seu site. A prioridade de suas páginas não será comparada com a prioridade das páginas de outros sites.</font></td>  </tr>  </tbody></table>  <p><font size="-1"><b>urllist<br></b></font><font size="-1">Tag opcional que pode ser usada para apontar um arquivo de texto que contenha uma lista de URLs do site. </font></p>  <pre>&lt;urllist path="/var/www/html/urllist.txt" encoding="UTF-8" /&gt;</pre>  <br>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>path</pre></td>  <td width="6%" valign="top"><font size="-1">obrigatório</font></td>  <td valign="top" width="75%"><font size="-1">O caminho e o nome de arquivo do arquivo .txt. Você pode especificar um caminho relativo ou completo. </font></td>  </tr><tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">A codificação do arquivo, caso não seja UTF-8.</font></td>  </tr>  </tbody></table> <p><font size="-1"><a name="urllist_reference"></a>O arquivo <b>urllist.txt</b> é um arquivo de texto simples que contém uma lista de URLs que serão mapeados. Você também pode incluir atributos opcionais para cada URL. Os atributos são inseridos na mesma linha do URL e são separados por um espaço simples.  Por exemplo:</font></p>  <pre>http://www.example.com/abc/something
http://www.example.com/abc/xyy.pdf lastmod=2001-12-31T14:05:06+00:00
http://www.example.com/abc/def?x=12&amp;y=23 changefreq=weekly priority=0.3</pre>  <p>  <font size="-1">   </font><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>lastmod</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top"><p><font size="-1">O horário em que o URL foi modificado pela última vez no formato de <a href="http://www.w3.org/TR/NOTE-datetime">data e hora do W3C</a> (AAAA-MM-DDThh:mm:ss+00:00).  Você pode omitir o horário. Exemplos:</font><font size="-1"><br>  <br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></p>  </td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1"><font size="-1"> A freqüência com que o URL é alterado. Isso é considerado uma dica e não um comando.  O valor deve ser um dos seguintes: "always", "hourly", "daily", "weekly", "monthly", "yearly" ou "never".</font></font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">A prioridade dessa página com relação a outras páginas em seu site. O valor é um número entre 0.0 e 1.0 em que 0.0 é a prioridade mais baixa e 1.0, a mais alta. A prioridade pode afetar a ordem em que os mecanismos de pesquisa selecionam os URLs que serão explorados no site. Como a prioridade é relativa, ela só é usada entre as opções de URLs do seu site. A prioridade de suas páginas não será comparada com a prioridade das páginas de outros sites.</font></td>  </tr>  </tbody></table>  </p>  <font size="-1">  </font>  <p><font size="-1"><strong>directory<br></strong></font><font size="-1"> Tag opcional que pode ser usada para especificar os diretórios em seu site de forma que o Sitemap Generator possa criar uma lista de URLs dos arquivos encontrados nesses diretórios. </font></p>  <pre>--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obrigatório</font></td>  <td width="75%" valign="top"><font size="-1">Indica o caminho inicial. O Sitemap Generator passará por esse diretório e por todos os subdiretórios</font>.</td>  </tr>   <tr>  <td valign="top"><pre>url</pre></td>  <td valign="top"><font size="-1">obrigatório</font></td>  <td valign="top"><font size="-1">Especifica o URL equivalente do caminho.</font></td>  </tr>  <tr>  <td valign="top"><pre>default_file</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifica o arquivo padrão do diretório no servidor.</font></td>  </tr>  </tbody></table>  </font>  <p><font size="-1"><b> accesslog<br></b>Tag opcional que pode ser usada para especificar o caminho e o nome do arquivo dos arquivos de registros IIS e Apache de forma que o Sitemap Generator possa selecionar automaticamente seus URLs. </font></p>   <pre>&lt;accesslog path="/etc/httpd/logs/access-0.log" encoding="UTF-8"/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obrigatório</font></td>  <td width="75%" valign="top"><font size="-1">Informe o caminho para o arquivo.</font></td>  </tr>   <tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">opcional</font></td>  <td valign="top"><font size="-1">Especifica a codificação do arquivo, caso não seja UTF-8.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><b> sitemap<br></b>Tag opcional que você pode usar para especificar o caminho e o nome dos Sitemaps existentes que você criou com o Sitemap Generator. O Sitemap Generator criará um único Sitemap que inclui os URLs contidos em cada Sitemap. </font></p>   <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obrigatório</font></td>  <td width="75%" valign="top"><font size="-1">Informa o caminho do arquivo Sitemap.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><strong><a name="filter_examples"></a>filter<br></strong></font><font size="-1">Tag opcional que pode ser usada para criar regras que incluem ou excluem determinados arquivos. Os filtros respeitam a ordem em que aparecem nos arquivos config.xml. No entanto, entradas de filtro combinadas e entradas de dados (url, urllist, directory ou accesslog) não causam efeitos adicionais - cada URL adicionado pelo Sitemap Generator ao Sitemap é comparada primeiramente com o filtro. </font><font size="-1">Caso nenhum filtro corresponda a um URL, o padrão é incluir o URL no Sitemap.</font></p>   <pre>&lt;filter action="drop" type="wildcard" pattern="*/internal/*" /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>action</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top">  <font size="-1"><p>A ação de filtragem deve ser considerada. Os valores válidos são:</p>  </font> <ul>  <li><font size="-1">drop - exclui os URLs correspondentes. Essa é a ação padrão, portanto se não houver uma ação especificada, o gerador usará &quot;drop&quot;.</font></li>  <li><font size="-1">pass - inclui os URLs correspondentes.</font></li>  </ul>  </p></td>  </tr>   <tr>  <td width="19%" valign="top"><pre>type</pre></td>  <td valign="top" width="6%"><font size="-1">opcional</font></td>  <td width="75%" valign="top"><font size="-1"><p>O tipo de filtro. Os valores válidos são:</p>  </font> <ul>  <li><font size="-1">wildcard - os curingas de caminho padrão (? e *) são usados para comparar os URLs. Esse é o tipo padrão, portanto se não houver um tipo especificado, o gerador usará &quot;wildcard&quot;.</font></li>  <li><font size="-1">regexp - expressões regulares são usadas.</font></li>  </ul></td>  </tr>  <tr>  <td valign="top"><pre>pattern</pre></td>  <td valign="top"><font size="-1">obrigatório</font></td>  <td valign="top"><font size="-1">Especifica o padrão de correspondência.</font></td>  </tr>  </tbody></table>  <font size="-1"> <p><b><a name="encoding"></a>Codificações</b></p>   <p>Os arquivos consultados pelo arquivo de configuração, sejam as listas de URL ou os registros do servidor, podem usar codificações diferentes do padrão UTF-8. Você pode especificar codificações alternativas no arquivo config.xml que podem afetar a maneira como a leitura de seus arquivos será feita pelo Sitemap Generator. Algumas codificações comuns são:</p>  <ul>  <li><strong>encoding="utf-8"</strong> é o padrão assumido</li><li><strong>encoding="ascii</strong>" é um subconjunto de UTF-8, por isso você não pode especificá-lo</li><li><strong>encoding="iso-8859-1</strong>" é comum para muitos idiomas europeus</li></ul>  </font>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="creating_mobile" id="creating_mobile"></a><b>2b. Informações adicionais sobre a criação de um arquivo de configuração móvel</b></td>  </tr>  </tbody></table>  <p><font size="-1">Você cria um arquivo de configuração para um Sitemap móvel da mesma forma de um Sitemap não-móvel. Entretanto, é preciso criar um arquivo de configuração separado para cada linguagem de marcação e executar o Sitemap Generator com cada um dos arquivos de configuração separadamente, por isso você cria um Sitemap separado para eles.</font></p>  <p><font size="-1">Cada arquivo de configuração deve:</font></p>  <ul>  <li><font size="-1">Especifique um nome de arquivo diferente para o valor <a href="#create_config"><strong>store_into</strong>.</a> </font></li>  <li><font size="-1">Utilize os <a href="#filter_examples">filtros</a> para especificar os URLs que devem ser excluídos e incluídos na linguagem de marcação. Lembre-se de que cada Sitemap deve incluir URLs apenas para uma linguagem de marcação. Isso significa que o mesmo URL pode ser incluído em vários Sitemaps caso esses URLs atendam a várias linguagens de marcação.</font></li>  </ul>  <p><strong><font size="-1">Exemplos de filtros</font></strong></p>  <p><font size="-1">A seguir estão alguns exemplos de como você pode usar os filtros com base na extensão para gerar os Sitemaps móveis para diferentes linguagens de marcação. A determinada filtragem que você for usar deve basear-se nos tipos de linguagens de marcação usados no site e na maneira como você especifica cada tipo. Se você tiver implementado os detalhes de seu site de forma diferente (por exemplo, se você organizou os URLs com diferentes linguagens de marcação em pastas separadas), deverá usar o filtro com base nas especificações da implementação do site. Lembre-se de que os filtros são aplicados na ordem em que você os relaciona no arquivo de configuração. Por isso, o primeiro filtro da lista deve ser o de ação "pass" que especifica os URLs que deseja incluir no Sitemap. </font></p>  <p><font size="-1">Para criar um Sitemap para o conteúdo WML (WAP 1.2):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.wml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
</pre>   <p><font size="-1">Para criar um Sitemap para o conteúdo do perfil móvel XHTML (WAP 2.0):</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.xhtml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
			</pre>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="copy"></a><b>3. Como fazer o upload de arquivos para o servidor</b></td>  </tr>  </tbody></table>  <p><font size="-1"> Faça o upload dos arquivos a seguir para o servidor cujo local possa ser acessado a partir da linha de comando: </font></p>   <font size="-1"><ul>  <li><strong> config.xml</strong> &#8212;é o arquivo de configuração recém-criado com a ajuda do arquivo <strong>example_config.xml</strong>.</li>  <li><strong> sitemap_gen.py</strong> &#8212; é o script Python que gera seu Sitemap.</li>  <li><strong> urllist.txt</strong> &#8212;esse campo é opcional; só será necessário incluí-lo caso você tenha utilizado o método de geração de Sitemap do arquivo de texto.</li>  </ul>   </font>  <p><font size="-1">O método utilizado para fazer upload desses arquivos depende do ambiente. Os métodos comuns incluem <a href="http://www.google.com/search?q=ftp">FTP</a> e SCP. Para obter mais informações, entre em contato com a empresa de hospedagem na web. </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="execute"></a><strong>4. Executando o script do Sitemap Generator (sitemap_gen.py) </strong></td>  </tr>  </tbody></table>   <p><font size="-1"> Para executar o Sitemap Generator, estabeleça conexão com seu servidor. O método utilizado para a conexão depende do ambiente. Por exemplo, você pode acessar um servidor com base UNIX usando o <a href="http://www.google.com/search?q=ssh">SSH</a>. Para obter mais informações sobre a conexão com o servidor e a execução de scripts, entre em contato com sua empresa de hospedagem na web. </font></p>   <p><font size="-1"> Assim que você copiar os arquivos para seu servidor, será preciso executar o script do Sitemap Generator.  Conecte-se com o servidor e execute o comando a seguir (substitua <strong>&lt;path/config.xml&gt;</strong> pelo caminho e pelo nome de arquivo de seu arquivo de configuração; se você tiver feito o upload desse arquivo para o mesmo local do script do Python, poderá excluir o caminho):</font></p>   <pre>python sitemap_gen.py --config=&lt;path/config.xml&gt</pre> <p><font size="-1">Por exemplo, uma linha de comando com base em UNIX para ser parecida com:</font></p> <p><img src="images/python_command.gif" alt="Comando Python"></p> <p><font size="-1">Um shell de comando com base em MS-DOS pode ser parecido com:</font></p> <p><img src="images/python_dos.gif" alt="Comando Python"></p> <p><font size="-1"><b>Dica:</b> Se você quiser testar sua configuração, mas não está pronto para enviar o Sitemap, a sintaxe abaixo evitará que o Sitemap Generator entre em contato com o Google:</font></p>  <pre><br>$ python sitemap_gen.py --config=config.xml --teste</pre>  <font size="-1"><p>Você visualizará o status da solicitação no prompt de comando:</p></font> <pre>Reading configuration file: /path/config.xml
	Opened URLLIST "/path/urllist.txt"
	Walking DIRECTORY "/var/www/html/dir"
	Walking DIRECTORY "/var/www/html/dir2"
	Opened ACCESSLOG "/etc/httpd/logs/access-0.log"
	Sorting and normalizing collected URLs.
	Writing Sitemap file "/path/sitemap.xml.gz" with 1092 URLs
	Notifying search engines.
	Notifying www.google.com
	Count of file extensions on URLs:
		208  .html
		574  .jpg
		...
		Number of errors: 0
		Number of warnings: 0</pre>  <font size="-1">  <p>Se você não vir muitos resultados como esse, lembre-se de que a configuração verbose em seu arquivo de configuração afeta a quantidade de informações impressas na tela. Esse exemplo é uma representação da configuração verbose em "1".</p>  <p>Todos os erros no arquivo também serão retornados. Por exemplo, ao permitir que o atributo url= desative uma entrada de diretório, o script será da seguinte forma:</p></font> <pre>[ERROR] Directory entries must have both "path" and "url" attributes
	Number of errors: 1</pre>  <font size="-1">  </font>  <p><font size="-1">Corrija os erros no arquivo <b>config.xml</b> e execute o script novamente. Se não houver erros, o Sitemap Generator criará um novo arquivo <b>sitemap.xml.gz</b> no local especificado no arquivo de configurações. </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="submitting" id="submitting"></a><strong>5. Como enviar seu Sitemap para o Google </strong></td>  </tr>  </tbody></table>  <p><font size="-1"> O Sitemap Generator cria um arquivo <strong>sitemap.xml.gz</strong> no local especificado no arquivo de configuração. Após criar esse arquivo, verifique se ele pode ser acessado através de um navegador da web. Em seguida, <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">adicione-o</a> à sua Conta do <a href="https://www.google.com/webmasters/sitemaps/siteoverview">Google Sitemaps</a>. Isso permite que o Google lhe forneça informações estatísticas e de status úteis. Se o Google informar que há problemas com o Sitemap, você poderá corrigi-los e reenviar o Sitemap. O Sitemap só precisará ser adicionado de forma manual uma vez. Depois disso, você pode utilizar uma <a href="submit.html#ping">solicitação HTTP</a> para notificar o Google sobre as alterações feitas no Sitemap (embora você também possa reenviar o sitemap pela conta das ferramentas do Google para webmasters). </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="recur"></a><b>6. Configurando um script recorrente</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Sugerimos que o Sitemap Generator seja configurado para ser executado sempre que o conteúdo for alterado, a uma freqüência máxima de uma vez por hora.</p>  </font>  <p><font size="-1">Webmasters com um servidor UNIX podem considerar essa <a href="http://www.google.com/search?q=cron">definição</a>. </font></p>  <font size="-1"><p>webmasters usando outras plataformas devem entrar em contato com seu administrador de sistema para obter ajuda na configuração dos scripts recorrentes.  Você também pode ter acesso a outros benefícios do Google Sitemaps Group em <a href="http://www.google.com/webmasters/sitemaps/googlegroup?hl=pt-BR">Google Groups</a>.</p>   </font>  <p><font size="-1"> Você pode usar uma <a href="submit.html#ping">solicitação HTTP</a> para informar o Google sobre as alterações feitas no seu Sitemap. No entanto, certifique-se de efetuar login nas <a href="https://www.google.com/webmasters/sitemaps/siteoverview">ferramentas do Google para webmasters</a> com sua Conta do Google para <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">adicionar o Sitemap</a> manualmente na sua conta de ferramentas do Google para webmasters.</font></p>  <font size="-1"></font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="troubleshoot"></a><b>Solução de problemas</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Nesta seção falamos sobre algumas questões e problemas comuns com os quais algumas pessoas se deparam ao usar o Sitemap Generator e o que é possível fazer quando esses problemas acontecem.</p>  <p><b>acessível via web</b></p>  <p><b>Problema:</b> O Sitemap Generator retorna o seguinte erro e aviso:</p>  </font> <pre>[ERROR] When attempting to access your generated Sitemap at the following URL:
	http://www.example.com/sitemap.xml.gz
	we failed to read it.  Please verify the store_into path you specified in
	your configuration file is web-accessible.  Consult the FAQ for more
	information.
	[WARNING] Proceeding to notify with an unverifiable URL.</pre>  <font size="-1">  <p><b>O que aconteceu?</b> O Sitemap Generator criou o arquivo no local especificado e, em seguida, tentou recuperá-lo usando o HTTP como o mecanismo de pesquisa, mas ocorreu uma falha. De qualquer forma, o processo continuou e os mecanismos de pesquisa foram notificados, mas essa é uma geração de erro e aviso que lhe permite saber que o Sitemap não pôde ser lido pelos mecanismos de pesquisa.</p>  <p>O Sitemap Generator cria o arquivo Sitemap no caminho especificado no atributo store_into do arquivo <b>config.xml</b>.  O Sitemap Generator cria um URL para o arquivo que está usando o atributo base_url e reporta o URL para os mecanismos de pesquisa.  Por exemplo, se você definir a configuração como:</p>  </font> <pre>&lt;site base_url="http://www.example.com/"
	      store_into="/var/www/html/sitemap.xml.gz"&gt;</pre>  <font size="-1">  </font><p><font size="-1">O Sitemap Generator enviará uma notificação para os mecanismos de pesquisa para que busquem pelo Sitemap em:</font></p>   <pre>http://www.example.com/sitemap.xml.gz</pre>  <font size="-1"><p>O arquivo deve ser acessível através desse URL. Se o arquivo não puder ser recuperado usando esse URL, os mecanismos de pesquisa não terão como localizar seu Sitemap.</p>  </font><p><font size="-1"><b>O que você pode fazer?</b> Verifique se o arquivo <b>config.xml</b> está especificando os caminhos corretos de base_url e store_into para seu Sitemap. Confirme também se os navegadores da web podem recuperar o arquivo Sitemap da base_url. Se você encontrar erros no caminho ou no URL, talvez seja preciso executar o Sitemap Generator novamente ou apenas mover o arquivo Sitemap para o local correto e notificar os mecanismos de pesquisa manualmente até os sites.  </font></p>  <font size="-1"><p><b>Suporte para XML</b></p>  <p><strong>Problema:</strong> O Sitemap Generator retorna o seguinte erro:</p>  </font> <pre>Some installs of Python 2.2 do not include complete support for XML. 
	Please try upgrading your version of Python and re-running the script.</pre>  <font size="-1"><p><b>O que aconteceu?</b> Como informa a mensagem, algumas plataformas apresentam uma versão do Python (idioma em que o script do Sitemap Generator foi gravado) em que não constam as bibliotecas necessárias para o processamento dos arquivos em XML.  Para que possa ser executado, esse script requer suporte total para XML.</p>  <p><b>O que você pode fazer?</b> Tente atualizar a versão já instalada do Python para uma versão mais recente.  Provavelmente será preciso entrar em contato com seu administrador de sistema.</p>  <p>Observe que isso afeta somente o Sitemap Generator, não todos os Sitemaps. Se você tiver um outro método ou ferramenta para criar Sitemaps, poderá utilizá-los e enviar os Sitemaps aos mecanismos de pesquisa.</p>  <p><b>Quais são todos os arquivos extras em.gz ou .zip?</b></p>  <p>Ao extrair o script sitemap_gen.py, provavelmente você verá mais arquivos do que aqueles que mencionamos anteriormente.  A lista completa de arquivos se parece com esta:</p>  </font>  <pre>AUTHORS
	ChangeLog
	COPYING
	example_config.xml
	example_urllist.txt
	PKG-INFO
	README
	setup.py
	sitemap_gen.py
	test_sitemap_gen.py</pre>  <font size="-1"><p>Os arquivos extras contêm os termos de licença e informações sobre o pacote.  Recomendamos a leitura do conteúdo desses arquivos.</p>  <p>A única exceção é o test_sitemap_gen.py, que é um script de teste de unidade que pode ser útil a outros desenvolvedores que quiserem contribuir com esse projeto de código-fonte. Se você pretende usar o Sitemap Generator sem modificar qualquer código-fonte - essa é a atitude esperada de quase todos usuários - provavelmente não precisará desse script de teste.</p>Se quiser colaborar com esse projeto, visite <a href="http://sourceforge.net/projects/goog-sitemapgen">http://sourceforge.net/projects/goog-sitemapgen</a>. <a href="http://code.google.com/sm_thirdparty.html">Aqui</a> você também pode encontrar links para alguns programas de terceiros que suportam os Sitemaps do Google.</p>   <font size="-1"></font></font>  <p><font size="-1"><b><a name="nonascii"></a>Caracteres não-ASCII </b></font></p>  <font size="-1"><font size="-1">  </font></font>  <p><font size="-1"><strong>Problema:</strong> O nome de domínio do seu site ou o URL contém caracteres não-ASCII.</font></p>  <p><font size="-1">Geralmente, URLs não-ASCII devem ser <a href="protocol.html#escaped">codificados usando UTF-8</a> antes de a porcentagem do escape ser configurada. No entanto, alguns servidores só respondem corretamente se os URLs não forem codificados usando UTF-8. Todos os URLs do seu Sitemap, assim como o URL do próprio Sitemap, devem ser codificado para capacidade de leitura pelo servidor no qual ele está localizado. Dentro da <a href="#sitetag">site seção de definição</a>, use o atributo opcional <strong>default_encoding</strong> para especificar a codificação usada pelo seu servidor. Se você não usar esta tag e o seu servidor usar uma codificação diferente da UTF-8, não poderemos saber que codificação usar.</font></p>  <p><font size="-1">Se os seus URLs contiverem caracteres não-ASCII, recomendamos que você execute o script do Sitemap Generator usando o Python 2.3 ou superior. Essa versão do Python aumentou o suporte a caracteres não-ASCII. Se o seu nome de domínio contém caracteres não-ASCII, você deve usar o Python 2.3 ou superior, já que o suporte a Internationalizing Domain Names in Applications (IDNA) não foi adicionado até esta versão. Sem o suporte a IDNA, o Sitemap Generator não pode codificar corretamente um nome de domínio não-ASCII. </font></p>  <font size="-1">     <br>  <p class="d" align="right"><i>Última modificação em: 15 de abril de 2006</i></p>  </font></div>  </td>  </tr>  <tr>  <td width="1%" valign="top"><img src="http://www.google.com/images/art.gif" width="143" height="53" vspace="5" hspace="15"></td>  <td style="background-color: #ffffff" width="1" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td valign="middle"><div class="footer">  <div align="center"><font size="-1"> &copy;2007 Google - <a href="http://www.google.com/privacy.html">Política de privacidade</a> -  <a href="http://www.google.com/accounts/TOS">Termos e condições</a> - <a href="http://www.google.com/about.html">Sobre o Google</a> </font></div>  </div></td>  </tr> </table> </body> </html>  